1 Expresiones Regulares

La primera sección de este documento se basará en las Expresiones Regulares, también conocidas como regex, regexp o expresión racional. Estas son secuencias de caracteres que forman un patrón de búsqueda, principalmente utilizadas para la búsqueda de patrones de cadenas de caracteres u operaciones de sustituciones. 1

Dos páginas de internet para saber más sobre los usos de Expresiones Regulares son UC Business Analytics y Diego Calvo las cuales muestran ejemplos de cómo utilizar Expresiones Regulares.

Ambas fuentes son de gran ayuda a la hora de trabajar con Expresiones Regulares pero considero que la más completa es la de UC Business Analytics debido a que brinda una explicación más extensa de las distintas Expresiones Regulares con las que estemos trabajando, mientras que la de Diego Calvo únicamente muestra un ejemplo para cada una de las Expresiones Regulares que puede dejar al lector con dudas de por qué lo realizó de esa manera.


2 RMarkdown

RMarkdown es un formato que permite una fácil creación de documentos, presentaciones dinámicas e informes de R. Markdown es un formato de sintaxis simple para crear documentos en HTML, PDF, y Word. 2

Existen múltiples guías y recursos acerca de RMarkdown en internet, sin embargo para mi gusto considero que la más efectiva y dinámica es la guía de RStudio debido a que esta abarca todo lo básico relacionado a RMarkdown para poder crear documentos en el formato que desees.

Un punto negativo a tomar en cuenta de la guía de RStudio es que no contiene información de como crear una tabla de contenido en mi documento. Esta información si puede ser encontrada en otra guía útil como lo es R para Ciencia de Datos la cual también ofrece a detalle recursos de RMarkdown. Esta última guía también contiene informaciones sobre creaciones de gráficos que no abarca la página web de RStudio utilizando las funciones ggplot2 y ggrepel para, por ejemplo, colocar etiquetas, anotaciones, ajustar escalas, y cambiar los temas de las gráficas.


3 Copa Mundial de Fútbol Rusia 2018

Esta sección muestra y analiza datos de la Copa Mundial de Fútbol llevada a cabo en Rusia en el verano de 2018. El torneo se disputó en 11 ciudades en las cuales participaron 32 países resultando Francia el campeón del certamen, que derrotó por 4-2 a Croacia en la final, y se consagró por segunda vez después de 20 años.

Esta edición del torneo, además de ser la vigésima primera edición también fue la más cara de la historia. Por otra parte, es la primera vez que se utilizó el árbitro asistente por video (VAR por sus siglas en inglés) y un balón oficial con un chip incorporado para seguir los partidos en vivo mediante una aplicación en esta competencia. 3

3.1 Goles y posesión del balón

Aunque la copa se jugó desde el 2018-06-14 hasta el 2018-07-15, esta subsección solo analizará datos de la primera semana del torneo que comprende desde el 2018-06-14 hasta el 2018-06-21.

Dicho esto, analizando los goles y la posesión del balón (que representa el porcentaje de tiempo del total del partido que cada equipo tiene el balón) por país se esperaría que los equipos con mayor posesión de balón fueran también los que mayores goles anotan. El gráfico a continuación muestra la relación entre ambas variables por país. La posesión promedio del balón fue de 50% mientras que los goles anotados en promedio fue de 1.11 goles por equipo.

El equipo de mayor posesión de balón y mayor cantidad de goles fue España con un total de 4 goles y un promedio de posesión de balón de 65.5%.

3.2 Jugador del Partido

Del mismo modo que se espera que a mayor posesión de balón, mayor cantidad de goles, también es de esperar que el equipo, o más bien el jugador, que domina el partido (tanto en posesión como goles) sea premiado como “Man Of The Match” equivalente a ser el mejor jugador del partido.

El gráfico a continuación divide la posesión del balón y el total de goles en si (Yes) fue elegido como “Jugador del partido” o no.

Un punto a destacar es que Francia tuvo un partido con dos goles y 51% de posesión de balón pero ninguno de sus jugadores fue premiado como “Jugador del Partido”. Sin embargo, tuvo un partido con un gol y 44% de posesión de balón y en este caso si recibió este reconocimiento. Similar sucedió con Portugal, el cual tuvo un partido con tres goles y ninguno de sus jugadores recibió este reconocimiento, pero disputó un partido marcando un gol y en este caso si recibieron el reconocimiento.

Por otro lado, Alemania tuvo un partido con cero goles anotados y uno de sus jugadores recibió el premio de “Jugador del Partido” siendo este el único equipo con dicha característica.

3.3 Estadísticas generales

La tabla a continuación (extraída de Wikipedia) muestra las estadísticas generales del torneo, donde “Puntos” está calculado por la cantidad de “Partidos Ganados” multiplicado por tres (3) y sumado a la cantidad de “Partidos Empatados” multiplicado por uno (1), “Diferencia de goles” se refiere a la diferencia entre los goles a favor y los goles en contra que tuvo el equipo, y por último “Rendimiento” representa el porcentaje de puntos logrados, es decir la división “Puntos” entre puntos posibles (partidos jugados multiplicado por tres).

El equipo de mayor rendimiento fue Francia (88.88%), quien también fue el campeón del torneo. España tuvo un rendimiento de 50% con una diferencia de goles de +1, lo que quiere decir que anotó un gol más de los que recibió en contra.